Consulta de Guías Docentes



Academic Year/course: 2023/24

30253 - Data Warehouses and Data Mining


Syllabus Information

Academic year:
2023/24
Subject:
30253 - Data Warehouses and Data Mining
Faculty / School:
110 - Escuela de Ingeniería y Arquitectura
326 - Escuela Universitaria Politécnica de Teruel
Degree:
439 - Bachelor's Degree in Informatics Engineering
443 - Bachelor's Degree in Informatics Engineering
ECTS:
6.0
Year:
4
Semester:
First semester
Subject type:
---
Module:
---

1. General information

 

Students will become familiar with the design of data warehouses and their subsequent exploitation using data mining techniques . Theoretical concepts, the different existing design techniques, and the different approaches that can be adopted will be discussed in order to formulate questions about the data warehouse. Whenever possible, use real examples . Computer tools that support the solution of this type of problems will also be discussed.

Since data warehouses enable the extraction of information useful for decision making in organizations, can also be used in scenarios that address SDG challenges. Therefore, it is considered that the acquisition of the learning results of the subject provides training and competence to the student to contribute to some extent to the achievement of the Sustainable Development Goals in a cross-cutting manner.

 

2. Learning results

 

  • Be able to describe the basic aspects of data warehouses and explain the processes required for their design.

  • Be able to design a data warehouse effectively.

  • Know the basics of data warehouses and is able to search for additional information on other advanced related topics.

  • Be able to compare various data warehouse designs and choose an appropriate commercial system for implementation.

  • To know the basic techniques of machine learning applied to data mining.

  • Use basic techniques in real problems.

 

3. Syllabus

 

1. Introduction to data warehouses

  • Basic concepts:

    • User requirements analysis.
    • Life cycle.
    • The problem of data source reconciliation.
    • OLTP versus OLAP transactions.
  •  Data warehouse architecture:

    • Conceptual, logical and physical design.
    • ETL procedures.
  • Commercial systems.

 

2. Introduction to data mining:

  • Knowledge and data discovery.

  • Web Mining.

  • Data analysis tools.

  • Areas of application, e.g:

    • Decision-making (banking-finance-insurance, marketing, health/demographic policies, etc.).
    • Industrial Processes.
    • Reverse Engineering.

 

4. Academic activities

 

Lectures: sessions with the teachers in which the subject matter will be explained: 30 hours.

Problems and cases: sessions to solve practical cases presented by the teacher: 15 hours.

Laboratory practices: 15 hours.

Study of the subject; class preparation; practical activities: 84 hours.

Assessment tests. 6 hours.

Estimated hours for each type of activity are indicated.

 

5. Assessment system

 

Continuous assessment:

1. Practical computer work (internships): 40% of the final grade.

2. Practical work/projects: 20% of the final grade.

3. Written test with theoretical and practical assumptions: 40% of the final grade.

In the continuous assessment, the delivery of assignments and their presentations will be made throughout the development of the subject on the dates set by the teaching staff. The final grade will be obtained as the weighted average of the parts of which consists the assessment, taking into account that it is necessary to have at least 5.0 points out of 10.0 in each of them. In case of not reaching this minimum in any of the parts, the final grade will be the minimum between 4.0 and the result of weighting with the percentages of each part.

 

Final global test:

It will include the written test. In addition, students who have not submitted the practices and/or assignments regularly on the established partial due dates (or whose submissions are deficient) must submit said internships and/or assignments as part of the overall final exam, and must also pass an additional related test consisting of the resolution of a statement. The final grade is calculated as in the continuous assessment.

 


Curso Académico: 2023/24

30253 - Almacenes y minería de datos


Información del Plan Docente

Año académico:
2023/24
Asignatura:
30253 - Almacenes y minería de datos
Centro académico:
110 - Escuela de Ingeniería y Arquitectura
326 - Escuela Universitaria Politécnica de Teruel
Titulación:
439 - Graduado en Ingeniería Informática
443 - Graduado en Ingeniería Informática
Créditos:
6.0
Curso:
4
Periodo de impartición:
Primer semestre
Clase de asignatura:
---
Materia:
---

1. Información básica de la asignatura

El estudiantado se familiarizará con el diseño de almacenes de datos y su posterior explotación utilizando técnicas de minería de datos. Se abordarán los conceptos teóricos, las distintas técnicas de diseño existentes, y las diferentes aproximaciones que pueden adoptarse para luego formular preguntas sobre el almacén de datos. Cuando sea posible, se recurrirá a ejemplos reales. También se tratarán herramientas informáticas que dan soporte a la solución de este tipo de problemas.

Dado que los almacenes de datos permiten extraer información de utilidad para la toma de decisiones en las organizaciones, pueden utilizarse también en escenarios que permiten abordar retos de los ODS. Por ello, se considera que la adquisición de los resultados de aprendizaje de la asignatura proporciona capacitación y competencia al estudiante para contribuir en cierta medida al logro de los Objetivos de Desarrollo Sostenible de forma transversal.

2. Resultados de aprendizaje

  • Es capaz de describir los aspectos básicos de los almacenes de datos y de explicar los procesos necesarios para su diseño.
  • Es capaz de diseñar un almacén de datos de forma efectiva.
  • Conoce los aspectos básicos de los almacenes de datos y es capaz de buscar información adicional sobre otros temas relacionados avanzados.
  • Es capaz de comparar diversos diseños de almacenes de datos y de elegir un sistema comercial adecuado para su implantación.
  • Conocer las técnicas básicas de aprendizaje automático aplicado a la minería de datos.
  • Utilizar las técnicas básicas en problemas reales.

3. Programa de la asignatura

1. Introducción a los almacenes de datos

  • Conceptos básicos:
    • Análisis de requerimientos de usuario.
    • Ciclo de vida.
    • El problema de la reconciliación de fuentes de datos.
    • Transacciones OLTP frente a OLAP.
  •   Arquitectura de almacenes de datos:
    • Diseño conceptual, lógico y físico.
    • Procedimientos ETL.
  • Sistemas comerciales.

2. Introducción a la minería de datos:

  • Descubrimiento de conocimiento y datos.
  • Minería Web.
  • Herramientas de análisis de datos.
  • Áreas de aplicación, por ejemplo:
    • Toma de decisones (Banca-finanzas-seguros, marketing, políticas sanitarias/demográficas, etc.).
    • Procesos Industriales.
    • Ingeniería Inversa (Reverse Engineering).

4. Actividades académicas

Clases magistrales: sesiones con el/la profesor/a en las que se explicará el temario de la asignatura: 30 horas.
Problemas y casos: sesiones de resolución de casos prácticos planteados por el/la profesor/a: 15 horas.
Prácticas de laboratorio: 15 horas.
Estudio de la materia; preparación de clases; actividades prácticas: 84 horas.
Pruebas de evaluación: 6 horas.

Se indican las horas estimadas de cada tipo de actividad.

5. Sistema de evaluación

Evaluación continua:

  1. Realización de trabajos prácticos con ordenador (prácticas): 40% de la nota final.
  2. Realización de trabajos/proyectos prácticos: 20% de la nota final.
  3. Prueba escrita con supuestos teóricos y prácticos: 40% de la nota final.

En la evaluación continua, las entregas de trabajos y sus presentaciones se realizarán a lo largo del desarrollo de la asignatura en las fechas fijadas por el profesorado. La calificación final se obtendrá como la media ponderada de las partes de las que consta la evaluación, teniendo en cuenta que es necesario tener al menos 5.0 puntos sobre 10.0 en cada una de ellas. En caso de no alcanzar ese mínimo en alguna de las partes, la calificación final será la mínima entre 4.0 y el resultado de ponderar con los porcentajes de cada parte.

Prueba final global:

Incluirá la prueba escrita. Además, los/as estudiantes que no hayan entregado las prácticas y/o trabajos de forma regular en las fechas de entrega parciales establecidas (o cuyas entregas sean deficientes) deberán hacer entrega de dichas prácticas y/o trabajos como parte de la prueba final global, debiendo superar además una prueba adicional relacionada consistente en la resolución de un enunciado. La calificación final se calcula como en la evaluación continua.